ExpFusion

传入一个数组,逐元素计算其乘上输入因子(可选择)后的指数值,再将指数值乘上输出因子后输出。

\[ \begin{align}\begin{aligned}\begin{split}dst_i = \exp(src_i \cdot s_{in}) \cdot s_{out} \quad \text{where} \quad s_{in} = \begin{cases} 1, & scale = 1 \\ in\_scale, & scale \neq 1 \end{cases}\end{split}\\\quad s_{out} = out\_scale\end{aligned}\end{align} \]
输入:
  • src_data - 输入数据地址。

  • length - 计算长度。

  • in_scale - 输入缩放因子,当scale != 1时启用。

  • out_scale - 输出缩放因子。

  • scale - 输入缩放因子启用控制。

  • core_mask - 核掩码(仅适用于共享存储版本)。

输出:
  • dst_data - 计算结果地址。

支持平台:

FT78NE MT7004

备注

  • FT78NE 支持int8, int16, int32, fp32, fp64, cplx64, cplx128

  • MT7004 支持fp16, fp32, int16, int32, cplx64

共享存储版本:

void i8_expfusion_s(int8_t *src_data, int8_t *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
void i16_expfusion_s(int16_t *src_data, half *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
void i32_expfusion_s(int *src_data, float *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
void hp_expfusion_s(half *src_data, half *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
void fp_expfusion_s(float *src_data, float *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
void dp_expfusion_s(double *src_data, double *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
void c64_expfusion_s(float *src_data, float *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
void c128_expfusion_s(double *src_data, double *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)

C调用示例:

 1//FT78NE示例
 2#include <stdio.h>
 3#include <expfusion.h>
 4
 5int main(int argc, char* argv[]) {
 6    float *input0 = (float *)0xA0000000;   //input在DDR空间
 7    float *output = (float *)0xC0000000;
 8    int length = 1000;
 9    float in_scale = 0.5, out_scale = 1.2;
10    int scale = 1;
11    int core_mask = 0xff;
12    fp_expfusion_s( input0, output, length, in_scale, out_scale, scale,core_mask);
13    return 0;
14}

私有存储版本:

void i8_expfusion_p(int8_t *src_data, int8_t *dst_data, int length, float in_scale, float out_scale, int scale)
void i16_expfusion_p(int16_t *src_data, half *dst_data, int length, float in_scale, float out_scale, int scale)
void i32_expfusion_p(int *src_data, float *dst_data, int length, float in_scale, float out_scale, int scale)
void hp_expfusion_p(half *src_data, half *dst_data, int length, float in_scale, float out_scale, int scale)
void fp_expfusion_p(float *src_data, float *dst_data, int length, float in_scale, float out_scale, int scale)
void dp_expfusion_p(double *src_data, double *dst_data, int length, float in_scale, float out_scale, int scale)
void c64_expfusion_p(float *src_data, float *dst_data, int length, float in_scale, float out_scale, int scale)
void c128_expfusion_p(double *src_data, double *dst_data, int length, float in_scale, float out_scale, int scale)

C调用示例:

 1//FT78NE示例
 2#include <stdio.h>
 3#include <expfusion.h>
 4int main(int argc, char* argv[]) {
 5    float *input0 = (float *)0x10810000;   //input在L2空间
 6    float *output = (float *)0x10820000;
 7    int length = 1000;
 8    float in_scale = 0.5, out_scale = 1.2;
 9    int scale = 1;
10    fp_expfusion_p( input0, output, length, in_scale, out_scale, scale);
11    return 0;
12}